AI资讯新闻榜单内容搜索-大模型

在数学上把稀疏注意力做对！腾讯Hy开源HiLS-Attention: 计算更少效果更好, 外推512倍

让大模型 "读得更长" 一直是 Agent、深度推理和海量资料整合等场景的刚需，但标准全注意力机制的计算量随序列长度呈平方级增长，始终是横亘在长上下文建模面前的三座大山。

来自主题: AI技术研报

8694 点击 2026-07-20 15:19

ISSTA 2026｜LAVE：面向扩散语言模型的约束解码

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

8698 点击 2026-07-16 10:09

用推理步骤的「语义冗余」给LRM过度思考踩刹车

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

5585 点击 2026-07-16 10:08

刚刚，Thinking Machines首发大模型 Inkling ：9750亿参数，完整开放权重

机器之心编辑部由 OpenAI 前首席技术官 Mira Murati 创立的 AI 初创公司 Thinking Machines Lab，刚刚发布了自研 AI 模型 Inkling。与 OpenAI、Anthropic 或 Google 的旗舰模型不同，Inkling 是一款开放权重模型，外部开发者和企业可以直接下载，并根据自身需求进行修改。

来自主题: AI资讯

9859 点击 2026-07-16 08:56

北航、北大和美团联合提出：策略提升强化学习!

来自北航、北大、美团的研究团队提出了Policy Improvement Reinforcement Learning, PIRL，以及对应的落地算法 PIPO。这项工作关注的是大模型 RL 后训练中一个非常基础、但长期被默认跳过的问题：一次更新在当前数据上看起来优化了学习信号，是否就真的说明模型策略变强了？

来自主题: AI技术研报

7917 点击 2026-07-12 10:44